Introdução

Descritiva

Neste seção temos a uma descrição dos dados. No caso, nosso variável de interesse é trsgi

Valores descritivos dos dados
age_CE trsgi numsamp
Min. : 441.0 Min. :0.4000 Min. : 1.00
1st Qu.: 824.2 1st Qu.:0.8305 1st Qu.: 3.00
Median :1207.5 Median :0.9860 Median : 9.00
Mean :1207.5 Mean :1.0000 Mean :14.17
3rd Qu.:1590.8 3rd Qu.:1.1470 3rd Qu.:26.00
Max. :1974.0 Max. :1.9420 Max. :39.00
Série Análisada

Série Análisada

Foi adotado a tranformação Box-Cox usando o método loglik para normalizar a série e ajustar o modelo. Valor do teste de Shapiro-Wilk foi de 0,05137.

A série ajustada não apresentou raiz unitária, tendência deterministica e sazonalidade.

Resultados testes de raiz unitária
Testes H0 p_valor Conclusao
Augmented Dickey-Fuller Tendencia 0.01 NAO tendencia
Phillips-Perron Unit Root Tendencia 0.01 NAO tendencia
KPSS Test for Level NAO tendencia 0.10 NAO tendencia
Resultados teste de tendência determinística
Testes H0 p_valor Conclusao
Cox Stuart NAO tendencia 0.6911 NAO tendencia
Cox and Stuart Trend NAO tendencia 0.6371 NAO tendencia
Mann-Kendall Trend NAO tendencia 0.2007 NAO tendencia
Mann-Kendall NAO tendencia 0.2007 NAO tendencia
KPSS Test for Trend NAO tendencia 0.1000 NAO tendencia
Resultados teste de sazonalidade
Testes H0 p_valor Conclusao
Kruskall Wallis NAO Sazonal 0.8854 NAO Sazonal
Friedman rank NAO Sazonal 0.8896 NAO Sazonal

Ajuste dos modelos

Seção sobre os ajustes do modelos

Série completa apresenta 1534 observações seŕie de treino 1552 série de teste 12

Modelo 1

# Modelo 1
mod<-forecast::auto.arima(serie_train, seasonal = FALSE)
forecast::checkresiduals(mod$residuals)

## 
##  Ljung-Box test
## 
## data:  Residuals
## Q* = 20.736, df = 24, p-value = 0.6542
## 
## Model df: 0.   Total lags used: 24
summary(mod)
## Series: serie_train 
## ARIMA(4,0,2) with zero mean 
## 
## Coefficients:
##           ar1     ar2     ar3     ar4     ma1     ma2
##       -0.0367  0.1107  0.3122  0.1436  0.5547  0.2902
## s.e.   0.2647  0.2320  0.1149  0.0420  0.2659  0.1992
## 
## sigma^2 = 0.0317:  log likelihood = 469.56
## AIC=-925.12   AICc=-925.04   BIC=-887.82
## 
## Training set error measures:
##                        ME      RMSE       MAE MPE MAPE      MASE          ACF1
## Training set -0.004216867 0.1776974 0.1338152 NaN  Inf 0.5012275 -0.0008757207
coeftest(mod)
## 
## z test of coefficients:
## 
##      Estimate Std. Error z value  Pr(>|z|)    
## ar1 -0.036718   0.264670 -0.1387 0.8896616    
## ar2  0.110714   0.232031  0.4772 0.6332532    
## ar3  0.312190   0.114868  2.7178 0.0065713 ** 
## ar4  0.143636   0.041972  3.4222 0.0006212 ***
## ma1  0.554686   0.265946  2.0857 0.0370051 *  
## ma2  0.290184   0.199214  1.4566 0.1452156    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod_fc <- forecast(mod, h=12)

accuracy(mod_fc, serie_test)
##                        ME      RMSE       MAE      MPE     MAPE      MASE
## Training set -0.004216867 0.1776974 0.1338152      NaN      Inf 0.5012275
## Test set     -0.064346824 0.1338745 0.1183198 15.43101 71.07609 0.4431867
##                       ACF1 Theil's U
## Training set -0.0008757207        NA
## Test set      0.3594274651 0.8032671
test_forecast(actual = bc22.dados,
              forecast.obj = mod_fc,
              test = serie_test)